Raport przedstawia dominujące tematy w agendzie mediów internetowych w danym dniu i jest przygotowywany w oparciu o artykuły publikowane w ośmiu portalach informacyjnych: RMF 24, TVN24, TVN24 bis, Radio ZET, Gazeta.pl, Dziennik.pl, PAP oraz Interia. Metodyka opracowywania raportu uwzględnia tematy zawierające słowa, które wystąpiły więcej niż 15 razy w danym dniu oraz były kluczowe - tzn. ich statystyka Dunninga wyniosła co najmniej 10. Dokładna miara kluczowości statystycznej Dunninga (1993) została podana w pierwszej tabeli. Przy wyliczaniu tej miary częstość występowania słowa w danym dniu porównywana jest z wielokrotnością jego pojawiania się w okresie od 1 stycznia 2018 do bieżącego dnia. Wysoka wartość statystyki oznacza, że dane słowo wystąpiło częściej niż w okresie referencyjnym.
Poszczególne słowa zostały pogrupowane w tematy na podstawie występowania w tych samych akapitach.
Na wykresach przedstawiono współwystępowanie poszczególnych słów oraz ich kluczowość. Im czcionka jest większa i posiada ciemniejszą barwę, tym wyższa kluczowość danego słowa. Linie łączące wybrane słowa oznaczają, że podobieństwo cosinusowe między nimi wynosi co najmniej 0,4. Podobieństwo cosinusowe jest wyznaczane na podstawie występowania słów w tych samych akapitach.
Zdania, które podsumowują poszczególne tematy zostały wybrane za pomocą zmodyfikowanego algorytmu LexRank, który po raz pierwszy został opisany w artykule z 2004 r. W tym przypadku polega on na wyznaczeniu zdań, które zawierają najwięcej istotnych informacji dla danego tematu – zmodyfikowany algorytm uwzględnia częstotliwość występowania poszczególnych słów, ich istotność oraz powiązanie z tematem (podobieństwo cosinusowe).